Por Andrés Ramos, Presales Coordinator Hikvision Colombia
El fenómeno Deep Learning –o Aprendizaje Profundo– continúa entusiasmando al mundo de TI, mayormente, porque puede utilizarse de forma adecuada en aplicaciones prácticas y aprovecha el poder de la Inteligencia Artificial (IA).
El concepto de Deep Learning está inspirado en la forma en que funciona el cerebro humano. Las redes cerebrales están compuestas por miles de millones de neuronas interconectadas; el Deep Learning simula esta estructura. Estas redes multicapa pueden recopilar información y realizar las acciones correspondientes en función del análisis de esa información.
En los últimos dos años esta tecnología ha destacado en reconocimiento de voz, visión para computadoras, traducción de voz y mucho más. Incluso ha sobrepasado la capacidad humana en áreas como reconocimiento de rostros y clasificación de imágenes; esto ha sido la razón por la que se le ha prestado tanta atención en el campo de supervisión de video la industria de la seguridad.
La capacidad de esta tecnología para reconocer seres humanos, distinguiéndolos de los animales, por ejemplo, hace de ella una gran adición al arsenal de seguridad. Lo que resulta especialmente relevante en un mundo donde las falsas alarmas representan el 94% -99% de todas las alarmas, de acuerdo con las estadísticas aportadas por cuerpos de policía y de bomberos a nivel mundial.
Cómo funciona el aprendizaje profundo
El Aprendizaje profundo es muy distinto de otros algoritmos y es por eso por lo que resuelve las insuficiencias de algoritmos tradicionales.
El Deep Learning es muy similar al proceso de aprendizaje humano, y tiene un proceso de análisis de características abstractas capa por capa. Cuanto más profundo sea el nivel de cada capa, más específicos serán los componentes. Cuantas más características haya, más precisos serán el reconocimiento y la clasificación. Algunos de los beneficios más directos del Deep Learning incluyen una precisión de reconocimiento de patrones comparables o incluso mejores que los de la figura humana, robustas capacidades que evitan las interferencias, y la capacidad de clasificar y reconocer miles de otras características.
El Deep Leraning no requiere intervención manual pero necesita computadoras para extraer las características de las imágenes. De esta manera extrae tantas características de la imagen como le sean posibles, incluyendo algunas características muy abstractas difíciles de describir. Mientras más características se encuentren, mas preciso será el reconocimiento y la clasificación.
Desafíos de los sistemas existentes
Los sistemas de vigilancia convencionales detectan principalmente objetivos en movimiento, sin mayor análisis. Incluso las cámaras IP inteligentes sólo pueden asignar puntos individuales a una forma uno por uno, lo que dificulta el calibrado de algunas funciones (por ejemplo, frente o mejilla), disminuyendo así la precisión.
Para la seguridad perimetral, por ejemplo, se pueden usar (y se usan) otras tecnologías para proporcionar una seguridad más completa. Pero todo tiene sus desventajas. Los detectores de infrarrojos, por ejemplo, pueden llegar a saltarse un objeto, pero también son propensos a producir falsas alarmas causadas por animales. Las vallas electrónicas pueden ser un peligro para la seguridad y están limitadas en ciertas áreas. Otra desventaja de estas soluciones es que pueden ser más costosas y complicadas de instalar.
Las falsas alarmas también pueden ser ocasionadas por animales, hojas o incluso luz, por ello poder identificar la presencia de una forma humana realmente mejora la precisión de las funciones de VCA perimetrales. Las falsas alarmas frecuentes son siempre un problema para los usuarios finales, que necesitan dedicar tiempo a investigar cada una, lo que puede retrasar cualquier respuesta necesaria y, en general, afectar la eficiencia.
Basado en una serie de experimentos realizados, se concluyó que la precisión de reconocimiento de las soluciones que utilizan el algoritmo Deep Learning aumentó en un 38% lo que hace que la tecnología Deep Learning sea una gran ventaja en una solución de seguridad perimetral, con detección mucho más precisa de tráfico de personas, intrusión, y entrada y salida, por ejemplo.
Otros usos
El valor de la tecnología Deep Learning se extiende más allá de la seguridad tradicional. Por ejemplo, el seguimiento de los patrones de movimiento de las personas puede permitir determinar si están ‘merodeando’ y representan una posible amenaza en el futuro. Esta tecnología permite establecer un umbral en cinco metros de radio de movimiento, o diez segundos de permanecer en el mismo lugar, por ejemplo. Si la persona pasa cualquiera de los umbrales, se puede activar una alarma. La solución rastrea al individuo y compara este comportamiento con una base de datos para ver si reconoce un patrón.
Otra aplicación sería en un escenario en el que “caerse” podría ser una amenaza, como un hogar de ancianos, por ejemplo. Si un umbral de altura se estableció en 0.5m y un tiempo de duración de 10 segundos, por ejemplo, la solución podría ver a una persona caerse (a medida que pasa por debajo de 0.5m) y podría tener problemas (si se mantienen “a baja altura”). más de 10 segundos. La solución usa los parámetros establecidos para comparar con su base de datos y generar una alarma.
Con características y beneficios como estos, es fácil ver cuántas aplicaciones inteligentes podrían ser atendidas por la tecnología Deep Learning.